Statistics হল ডেটার একটি শাখা যা তথ্য সংগ্রহ, বিশ্লেষণ, ব্যাখ্যা, উপস্থাপন এবং সিদ্ধান্ত গ্রহণে সহায়ক। বেসিক স্ট্যাটিস্টিক্যাল ধারণাগুলি যেমন Mean, Median, Mode, এবং Variance ডেটা বিশ্লেষণের জন্য অপরিহার্য। এগুলি ডেটা সেটের বৈশিষ্ট্য এবং প্রবণতা বুঝতে সাহায্য করে।
১. Mean (গড়)
Mean (গড়) হল একটি ডেটা সেটের সব ভ্যালুর যোগফল, যা মোট ভ্যালুর সংখ্যা দ্বারা ভাগ করা হয়। এটি একটি সাধারণ পরিমাপ যা ডেটা সেটের কেন্দ্রীয় প্রবণতা প্রকাশ করে।
Formula:
যেখানে:
- হল ডেটার সব মানের যোগফল,
- হল ডেটার মোট সংখ্যা।
উদাহরণ:
ডেটা: [5, 10, 15, 20, 25]
গড় (Mean):
২. Median (মিডিয়ান)
Median (মিডিয়ান) হল একটি ডেটা সেটের মধ্যে মধ্যবর্তী মান। এটি ডেটা সেটের সমস্ত মানকে আকারিকভাবে সাজানোর পর মধ্যবর্তী মানকে নির্দেশ করে। যদি ডেটার সংখ্যা অপরিবর্তিত থাকে (অথবা সংখ্যা সংখ্যা জোড় হয়), তখন মিডিয়ান ডেটা সেটের মাঝখানে থাকা মান হবে।
Formula:
- Odd number of data points: যদি ডেটার সংখ্যা বিসমিল থাকে, তখন মিডিয়ান হলো মধ্যম মান।
- Even number of data points: যদি ডেটার সংখ্যা জোড় থাকে, তখন দুটি মধ্যবর্তী মানের গড় হবে।
উদাহরণ:
ডেটা: [5, 10, 15, 20, 25]
এখানে, 5টি মান রয়েছে, সুতরাং মিডিয়ান হলো মধ্যবর্তী মান: 15।
এখন যদি ডেটা সংখ্যা জোড় হয়: ডেটা: [5, 10, 15, 20]
এক্ষেত্রে, দুইটি মধ্যবর্তী মানের গড় নেওয়া হবে:
৩. Mode (মোড)
Mode (মোড) হল একটি ডেটা সেটের সবচেয়ে বার বার আসা মান। এটি একটি ডেটা সেটের মধ্যে সর্বাধিক ঘটিত মানকে প্রকাশ করে। কিছু ডেটা সেটে একাধিক মোড থাকতে পারে, যেমন bimodal (২টি মোড) বা multimodal (একাধিক মোড)।
উদাহরণ:
ডেটা: [1, 2, 2, 3, 3, 3, 4, 5]
এখানে, 3 সবচেয়ে বেশি বার এসেছে, তাই মোড হলো 3।
৪. Variance (বৈচিত্র্য)
Variance (বৈচিত্র্য) হল একটি ডেটা সেটের ভ্যালুগুলির গড় থেকে তাদের বিচ্যুতি কতটা বড় তার পরিমাপ। এটি ডেটা সেটের ছড়ানো বা বৈচিত্র্য বোঝায়। Variance একটি স্কোয়ারড পরিমাপ এবং গড় থেকে মানগুলি কিভাবে বিচ্যুত হয়েছে তা বুঝতে সাহায্য করে।
Formula:
যেখানে:
- হল প্রতিটি ডেটা পয়েন্ট,
- হল গড় (Mean),
- হল ডেটার মোট সংখ্যা।
উদাহরণ:
ডেটা: [5, 10, 15, 20, 25]
গড় (Mean)
Variance:
Variance হল 50।
Mean, Median, Mode এবং Variance- এর মধ্যে পার্থক্য
| পরিমাপ | বর্ণনা | ব্যবহার |
|---|---|---|
| Mean | ডেটা সেটের গড় মান। | সাধারণ ডেটা পরিমাপ |
| Median | মধ্যবর্তী মান। যদি ডেটা সজ্জিত করা হয়, এটি মাঝখানে থাকবে। | ডেটার ছড়িয়ে পড়া কম হলে |
| Mode | সবচেয়ে বেশি বার আসা মান। | ক্যাটেগরিকাল ডেটার জন্য |
| Variance | গড় থেকে মানগুলির বিচ্যুতি পরিমাপ। | ডেটার বৈচিত্র্য বা বিস্তার |
সারাংশ
- Mean (গড়) হল ডেটা সেটের গড় মান।
- Median (মিডিয়ান) হল ডেটা সেটের মধ্যবর্তী মান।
- Mode (মোড) হল ডেটার সবচেয়ে বার বার আসা মান।
- Variance (বৈচিত্র্য) হল গড় থেকে ডেটার মানগুলির বিচ্যুতি পরিমাপ।
এই চারটি পরিমাপ আপনাকে ডেটা সেটের কেন্দ্রীকরণ, ছড়ানো, এবং বৈচিত্র্য সম্পর্কে মূল্যবান তথ্য প্রদান করে।
Read more